Як створюють українську LLM Lapa: 80 мільярдів токенів, бенчмарки й токенізація | AI HOUSE Podcast
Description
У цьому випуску говоримо про Lapa — першу українську reasoning LLM. Разом із Юрієм Панівим розбираємо, як народилася ідея створити модель, що мислить українською: від збору даних і побудови токенізатора — до тренування reasoning-здатності та очищення корпусу від пропаганди.
Також обговорюємо, як команда перевіряє, чи модель «розуміє» різні домени, що далі з мультимодальністю та як планують дистрибуцію Lapa.
📬 Посилання на благодійну організацію «Реактивна пошта»: https://reactivepost.org/
Спікери:
Гість — Юрій Панів Data Scientist у Nortal, аспірант УКУ | https://www.linkedin.com/in/yurii-paniv-aa969b151/?originalSubdomain=ua
Ведучий — Роман Кислий, Research Data Scientist | https://www.linkedin.com/in/romankyslyi/?originalSubdomain=ua
Якщо хочете підтримати наш проєкт, стати партнером та записати спільний епізод — пишіть нам на пошту hi@aihouse.org.ua
Корисні посилання: — Модель: https://huggingface.co/spaces/lapa-llm/lapa — Код: https://github.com/lapa-llm/lapa-llm
Про AI HOUSEAI HOUSE — це найбільше АІ-комʼюніті в Україні. Ми обмінюємося досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію ШІ та сприяємо народженню продуктових AI-стартапів вдома, в Україні.
Долучайтеся до нашого комʼюніті:
Facebook: https://www.facebook.com/AIHouse.Ukraine
Instagram: https://www.instagram.com/aihouse.ukraine/
Twitter: https://twitter.com/AIHouse_Ukraine
Telegram-чат для спілкування: https://t.me/aihousechat
Телеграм-канал: https://t.me/AIHOUSE




